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摘 要 ; [目的 /意义 ] 梳 理 国 内 外 研究 前 沿 相 关 成 果 , 归 纳 总 结 现 有 研究 存在 的 问题 ,为 学 科 领 域 研究 前 沿 识 别提 供 参 考 
借鉴 。[ 方 法 /过 程 ] 首先 对 研究 前 沿 识 别 的 必要 性 进行 归纳 总 结 ,其 次 对 相关 概念 进行 辨析 ,再 次 在 调研 国内 外 
相关 研究 基础 上 从 研究 前 沿 识 别 方法 研究 、 研 究 前 沿 识 别 新 方向 两 个 层面 对 其 进行 归纳 整理 ,最 后 指出 现 有 研究 
不 足 并 对 未 来 发 展 提出 展望 。| 结果 /结论 | 就 概念 界定 而 言 ,通过 从 时 间 维 度 和 定义 范围 两 方面 辨析 与 研究 前 沿 
相关 的 系列 概念 ,最 终 明确 研究 前 沿 的 内 涵 。 就 识别 方法 而 言 ,经 典 的 研究 方法 包括 直接 引用 、 共 被 引 分 析 、 文 献 
厅 合 以 及 基于 词 徐 的 研究 前 沿 识 别 方法 ;同时 ,基于 多 源 数 据 、 多 维 指标 以 及 机 器 学 习 算 法 的 研究 前 沿 识 别 是 未 
来 研究 的 新 方向 。 在 以 上 分 析 基 础 上 ,总 结 不 同类 型 研究 前 沿 识 别 方法 的 不 足以 及 存在 的 普 适 性 问题 ,并 对 未 来 
研究 重点 进行 展望 。 

词 : 研究 前 沿 专家 判读 ”引文 分 析 AADI 多 源 数据 多 维 指标 

: G253 


利于 科研 管理 者 从 研究 领域 的 本 身价 值 层面 (而 非 行 
| 政 占 优 ) 配 置 资源 ,推动 科学 发 展 的 良性 生态 ;有 利于 
3 科学 研究 的 本 质 是 探索 . 求 真 ,科学 的 发 展 是 _，| 决策 者 把 握 科学 发 展 规律 .动态 调整 政策 机 制导 向 , 进 
Mpaka RRIK .连续 和 中 断 的 不 断 循环 往 | 而 抢 得 科技 发 展 先 机 。 
复 的 关 学 家 要 进行 科技 创新 ,首先 需要 明确 本 鉴于 研究 前 沿 识别 的 现实 意义 ,国内 外 学 者 也 从 
APEEATEBIUTI i 1. . 痛 点 ,但 对 科研 人 员 来 说 ,难点 是 如 | 不 同 角度 出 发 对 研究 前 沿 进行 了 解读 ,但 尚 存在 以 定 
[TAE .选择 具有 突破 潜力 的 研究 方向 并 开展 实施 。 性 方法 为 主 、 概 念 内 涵 未 统一、 指标 体系 多 而 杂 等 问 
同 轩 ,根据 《中 国 科技 人 才 发 展 报告 (2018)》 和 《中 国 ，| 题 。 本 研究 在 调研 国内 外 相关 研究 成 果 中 发 现 ,对 于 
科 帕 人 力 资 源 发 展 研 究 报告 (2018 )》 可 知 ,中 国 的 科 | “研究 前 沿 " 和 "新 兴 研 究 主题 " 两 个 概念 ,国内 外 学 者 
技 人 力 资源 总 量 和 研究 与 试验 发 展 (R&D ) 人 员 全 时 | 经 常 将 其 等 同 或 近似 对 待 ,因此 在 借鉴 徐 硕 ” LU 
当量 持续 增长 ,并 连续 5 年 位 居 世 界 首 位 ,2017 年 | 超 ” ,张丽华 ”等 的 检索 策略 基础 上 ,本 研究 以 Web of 
R&D 人 员 总 量 达到 621.4 万 人 ,2018 年 底 科 技 人 力 资 | Science 数据 库 和 中 国 知 网 为 数据 源 ,分 别 以 TS = C" 
源 已 达 10 154.5 万 人 。 为 了 在 “科学 蛋糕 ”( 资 源 、 利 research * front * " OR" scien * front * "OR" academic * 
d 55) 的 分 配 中 争 得 优先 权 , 全 世界 科学 家 之 间 形 成 了 | front * " OR" frontier" OR" emerg * topic * " OR" emerg * 
愈加 激烈 的 学 术 竞 争 。 而 科学 前 沿 代 表 了 未 来 科学 发 | research * topic * "OR" emerg * scien * topic * " OR" 
展 的 关键 走向 ,从 本 质 来 看 ,科学 前 沿 即 为 科学 家 手中 | emerg* academic * topic * "OR" emerg * field  " OR" 
的 一 张 王牌 ,是 提高 科学 家 竞争 优势 的 保障 。 因 而 ,对 emerg * area * " OR" emerg ** research * field  " OR" 
人 研究 前 沿 开 展 持续 性 的 跟踪 ,监测 与 识别 ,尽早 发 现 、 emerg * research * area " OR" emerg * scien * field 
预 判 出 科学 领域 的 前 沿 方向 ,能 够 为 科学 家 把 握 研 究 x" OR" emerg * scien * area * " OR" emerg * trend 
焦点 奠定 基础 ,对 未 来 顺利 开展 研究 具有 重要 意义 ;有 *" ) 和 篇 名 = (研究 前 沿 OR 新 兴 人 研究 领域 OR 新 兴 
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研究 趋势 OR 新 兴 研究 主题 OR 新 兴 研 究 话题 ) 为 检 
索 式 ,检索 相关 主题 论文 。 进 一 步 地 ,根据 二 八 定律 ， 
结合 被 引 频次 ,筛选 国内 外 研究 前 沿 识别 重点 文献 , 同 
时 对 参考 文献 中 出 现 的 有 价值 文献 进行 回溯 检索 , 通 
过 对 上 述 重 点 文献 的 梳理 和 总 结 ,首先 对 研究 前 沿 相 
关 概 念 进行 辨析 ,讨论 不 同 概念 的 区 别 和 联系 ;其 次 从 
研究 前 沿 识别 方法 、 研 究 前 沿 识别 新 方向 2 个 层面 归 
纳 已 有 研究 内 容 ;最 后 总 结 现 有 研究 不 足 并 对 研究 前 
沿 识别 未 来 发 展 做 出 展望 。 与 已 有 研究 前 沿 相关 综述 
相 比 ,本 研究 的 创新 之 处 在 于 :首先 ,在 梳理 研究 前 沿 
经 典 系列 概念 基础 上 ,从 时 间 维 度 和 定义 范围 两 方面 
对 相关 概念 进行 辨析 介绍 ,进一步 明晰 各 个 概念 之 间 
异同 ,确定 本 研究 所 使 用 的 概念 体系 ;其 次 ,除了 梳理 
直接 引用 、 共 被 引 分 析 .文献 辜 合 以 及 基于 词 徐 的 研究 
前 锭 识别 常用 方法 外 ,补充 了 方法 性 能 比较 方法 间 的 


新 方向 进行 总 结 。 具 体 为 ;了 对 研究 前 沿 识别 中 的 数 
据 汤 以 及 不 同 数据 对 象 的 特色 进行 归纳 ;@ 对 研究 前 


没 龙 征 维度 以 及 每 一 维度 的 测度 指标 进行 梳理 ;@ 对 


的 新 应 用 进行 罗列 ;图 从 5 个 角度 更 
面 地 对 未 来 研究 重点 和 思路 进行 展望。 


研究 前 沿 相关 概念 辨析 


. J. Price 被 认为 是 研究 前 沿 (research front ) 
领域 的 鼻祖 ,其 于 1965 年 首次 提出 研究 前 沿 概念 ,他 
认为 引 文 网 络 中 最 近 的 、 被 广泛 引用 的 文献 集合 就 是 
活跃 的 研究 前 沿 ,并 将 其 形象 地 描述 为 “生长 尖端 ” 
( growing tip) 或 “表皮 层 ”(epidermal layer) ;1973 年 ， 
H. Small" 提出 研究 前 沿 是 高 被 引 论文 聚 类 的 结果 ， 
并 将 共 被 引 聚 类 的 方法 用 以 识别 研究 前 沿 。 至 此 ,二 
者 共同 奠定 了 研究 前 沿 领域 的 理论 和 方法 基础 ,此 后 
不 同学 者 也 从 不 同 视角 出 发 对 研究 前 沿 的 概念 进行 补 
充 和 完善 ,代表 性 的 定义 如 下 :1991 年 ,R. R. Braam 
等 中 认为 研究 前 沿 是 学 者 高 密度 关注 的 一 系列 主题 ， 
并 利用 共 被 引 聚 类 间 的 相似 性 来 探测 研究 前 沿 的 稳定 
性 ;1994 年 , 0，Persson ”将 被 引文 献 视 为 “研究 基 
础 ” ,而 将 引用 相同 论文 的 施 引 文献 簇 定义 为 “研究 前 
沿 ”; 同年 ,E，Garfield'" 将 所 有 共 被 引 聚 类 中 的 核心 
文献 及 其 施 引 文献 共同 称 为 研究 前 沿 ;1998 年 ,S. 
Bhattacharya 等 "借助 共 词 分 析 方法 ,直接 从 论文 标题 
中 抽取 主题 词 进行 共 词 聚 类 ,将 共 词 聚 类 所 形成 的 研 
究 主题 视 为 研究 前 沿 ;2003 4E,S. A. Morris 等 “将 研 


究 前 沿 与 范式 理论 相 结 合 , 认 为 研究 前 沿 是 特定 范式 
中 引用 一 组 持续 性 、 相 对 固定 的 文献 的 论文 集 ,强调 被 
引文 献 的 稳定 性 ;2006 年 , 陈 超 美 ”认为 研究 前 沿 可 
能 是 不 连续 的 ,是 某 个 领域 的 暂时 性 问题 , 故 将 研究 前 
沿 定义 为 一 组 突显 的 动态 概念 和 潜在 的 研究 问题 ; 
2008 年 ,N，Shibata ”将 最 新 的 直接 引文 聚 类 定义 为 
研究 前 沿 ;2010 4E,S. P. Upham 等 ” 认为 研究 前 沿 是 
科学 研究 领域 中 最 为 动态 变化 和 吸引 科学 家 关注 的 研 
究 主题 ,融合 了 科学 发 现 和 社会 关注 两 个 概念 ;2014 
年 , 许 晓 阳 等 “认为 科学 研究 中 最 近 出 现 .正在 兴 
的 研究 主题 或 研究 领域 就 是 研究 前 沿 ;2016 年 , 郑 彦 
宁 等 "认为 研究 前 沿 是 特定 研究 领域 和 特定 研究 时 
间 中 最 活跃 的 部 分 。 整 理 研 究 前 沿 的 相关 概念 见 表 
1。 关 于 研究 前 沿 的 英文 表述 主要 有 " research front" 
和 "research frontier" ,国内 学 者 钟 镇 5 分 别 从 理论 和 
实证 方面 对 两 个 术语 进行 了 详细 阐述 :research front 是 
一 个 先 验 评价 ,是 没有 经 过 实际 验证 的 期 竺 结果, 更 多 
地 出 现在 信息 计量 学 ; 而 research frontier 是 后 验 统 计 ， 
是 经 过 同行 专家 确认 价值 后 的 分 析 结 果 , 更 多 地 应 用 
在 自然 科学 。 也 有 学 者 认为 通过 科技 文献 所 识别 出 来 
的 研究 前 沿 更 偏 问 于 “人 研究 焦点 "或 “人 研究 热点 ” ,而 通 
常 认为 的 研究 前 沿 应 当 是 类 似 于 宇宙 起 源 、 生 物 演化 、 
物质 结构 等 少量 尖端 研究 领域 ,其 对 应 的 英文 是 re- 
search frontier, 


表 1 “研究 前 沿 ”的 代表 性 定义 


时 间 作者 定义 
1965 D. J. Price 近期 高 被 引文 献 的 集合 
1973 H. Small 被 引文 献 聚 类 


1991 R.R. Braam 等 施 引文 献 聚 类 

1994 0. Persson 基于 共 被 引 的 文献 耦合 聚 类 
1994 E. Garfield 被 引文 献 和 施 引 文献 的 集合 
共 词 聚 类 

2003  S.A.Monis 等 施 引 文献 看 合 聚 类 
2006 陈 超 美 突显 的 动态 概念 和 潜在 的 研究 问题 

2008 N. Shibata 直接 引文 聚 类 

小 的 高 被 引 聚 类 

最 近 出 现 ` 正 在 兴起 的 研究 主题 或 研究 领域 
某 段 时 间 某 个 研究 领域 中 最 新 出 现 ` 正 在 兴起 并 
引起 科学 家 高 度 关注 的 研究 主题 


1998 S. Bhattacharya 


2010 S. P. Upham 等 
2014 许 晓 阳 等 
2016 KRETE 


综 上 ,目前 国内 外 学 者 分别 从 不 同 角度 、 基 于 不 同 
原理 对 研究 前 治 进行 了 界定 。 对 研究 前 沿 的 定义 方式 
主要 分 为 两 大 类 :第 一 类 是 从 科技 文献 数据 角度 界定 
研究 前 沿 ,分 别 有 : 被 引文 献 . 施 引文 献 ,文献 本 身 三 个 
层面 ,代表 学 者 有 D.J. Price, H. Small, R. R. Braam,E. 
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， 草 玲 静 ,等 . 学 科 领 域 研究 前 沿 识 别 方法 研究 进展 [J]. 图 书 情报 工作 ,2022 ,66(12 ) :139 - 151. 


Garfield „S. Bhattacharya „S. P. Upham 等 ;第 二 类 则 是 从 
较为 宏观 的 角度 进行 界定 ,不 再 受 限 于 数据 源 ,更 加 强 
调研 究 的 动态 性 和 活跃 性 ,代表 学 者 有 陈 超 美 . 许 晓 
UH ` 郑 彦 宁 等 。 尽 管 学 者 们 对 研究 前 治 的 界定 方式 存 
在 差异 ,但 研究 前 沿 的 内 涵 是 清晰 的 :人 研究 前 沿 是 正在 
兴起 的 .具有 发 展 潜力 的 .未 来 可 能 会 引起 大 量 关 注 的 
研究 主题 或 研究 领域 ,其 具有 新 新 性 、 动 态 性 、 活 路 性 


时 间 


图 1 研究 前 沿 


学 科 前 沿 的 区 别 主 要 是 在 于 研究 领域 和 科学 .学 科 之 


的 特征 。 新 颖 性 是 指 研究 前 沿 应 当 是 一 个 研究 领域 最 
先进 的 研究 问题 ,代表 了 新 兴 的 发 展 趋 势 ; 动 态 性 是 指 
研究 前 沿 应 当 是 随 着 时 间 变 化 而 变化 的 ,具有 一 定 的 
时 效 性 ;活跃 性 是 指 研究 前 沿 应 是 能 够 引起 学 术 界 高 
度 关注 的 研究 主题 。 

在 信息 科学 领域 ,与 研究 前 沿 相 似 的 概念 有 很 多 ， 
如 新 兴 研 究 .研究 热点 .科学 前 沿 ,学科 前 沿 等 。 但 研 
究 前 沿 与 这 些 相似 概念 在 内 涵 上 存在 诸多 差异 ,如 与 
新 当 研 究 .研究 热点 存在 时 间 维度 上 的 差异 ,与 科学 前 
注 学 科 前 沿 存在 定义 范围 上 的 差异 
COCO 时 间 维 度 上 的 差异 “新 兴 研究 "是 指 当 下 新 
AIL DERE ER, 主要 特征 在 于 “新 ”, 突 出 时 间 新 颖 
性 导 部 涵 宁 ”将 新 兴 研 究 解释 为 初次 出 现 且 莲 勃 发 
胰 网 研究 ,认为 新 兴 研究 强调 的 是 当下 ,而 研究 前 沿 是 
在 鱼 定 时 间 段 内 引起 了 广泛 关注 的 新 兴 研 究 领 域 。 罗 


间 的 区 别 。“ 科 学 前 沿 " 是 指 具 有 前 脆性 .先导 性 、 理 
论 性 ,探索 性 ,并 对 科学 未 来 发 展 具有 重大 影响 和 引领 
作用 的 研究 ,又 称 为 “科技 前 沿 ” 。 科 学 前 沿 是 一 个 广 
义 的 概念 ,涵盖 了 所 有 与 科学 技术 相关 的 学 科 、 领 域 ， 
而 研究 前 沿 则 通常 限定 在 一 个 特定 研究 领域 。“ 学 科 
前 沿 " 是 指 某 一 学 科 中 最 有 价值 的 发 展 趋势 ,一般 是 制 
约 该 学 科 当 前 发 展 的 重大 关键 性 问题 ,其 讨论 范围 是 
学 科 。 刘 海峰 ” 认为“ 学科" 与 “研究 领域 " 的 重要 区 
别 在 于 是 否 具有 渗透 性 ,学 科 的 边界 通常 不 可 渗透 , 知 
识 具 有 稳定 性 和 整合 性 ,而 研究 领域 的 边界 是 可 渗透 
的 ,知识 相对 开放 和 松散 。 故 随 着 学 科 越 来 越 细 化 的 
划分 ,通常 多 个 学 科 对 应 于 一 个 研究 领域 。 具 体 来 看 ， 
三 者 在 定义 范围 上 的 关系 如 图 2 所 示 , 科 学 前 沿 是 最 
为 宏观 的 研究 前 沿 ,前 沿 问题 的 解决 可 能 将 科学 研究 
带 入 新 的 发 展 阶段 ,对 国民 经 济 和 社会 发 展 都 有 重要 


瑞 福 "认为 新 兴 研 究 虽 然 旦 现 *“ 年 轻 化 "和 “ 快 增长 
性 2 汶 4 趋势 ,但 并 不 代表 它 在 未 来 是 具有 研究 价值 和 研 
唐 激 景 的 研究 前 沿 , 即 研究 前 沿 应 是 有 价值 的 .稳定 的 
新 次 研究 “研究 热点 "是 指 关注 度 比较 高 的 研究 主 
题 : 主 要 特征 在 于 “ 热 ", 突 出 广泛 讨论 性 。 钟 镇 "9 指 
出 6 在 时 间 轴 上 ,前 一 时 段 具 有 学 术 价值 的 研究 前 沿 将 
会 有 较 大 概率 转化 成 新 时 段 的 研究 热点 , 即 研究 热点 
相对 于 研究 前 沿 在 时 间 维 度 上 具有 一 定 的 滞后 性 。 综 
上 ,笔者 认为 研究 前 沿 是 指正 在 兴起 的 .被 科学 界 高 度 
关注 的 .研究 内 容 具 有 一 定 创新 性 和 发 展 潜力 的 研究 
主题 ,其 在 新 颖 性 和 关注 性 的 基础 上 更 加 强调 的 是 主 
题 潜力 ,主要 特征 在 于 高 创新 性 与 高 影响 力 。 三 者 之 
间 的 关系 如 图 1 所 示 , 在 一 定 条 件 下 ,新 兴 研究 会 发 展 
成 为 研究 前 沿 ,而 部 分 研究 前 沿 又 会 成 为 研究 热点 。 
具体 来 看 ,新 兴 研 究 是 当下 的 研究 探索 ,在 未 来 可 能 会 
孕育 出 研究 前 洛 ;研究 前 沿 在 不 断 发 展 过 程 中 ,可 能 会 
引起 学 术 共同 体 的 广泛 关注 ,进而 发 展 成 为 研究 热点 。 
若 新 兴 研究 或 研究 前 沿 发 展 不 利 , 则 将 "销声匿迹 ”， 
也 就 不 能 相应 地 发 展 成 为 研究 前 沿 和 研究 热点 。 由 此 
可 见 , 研 究 热点 具有 明显 的 时 间 累 积 性 和 顺序 性 特征 。 

(2) 定 义 范围 上 的 差异 。 研 究 前 沿 与 科学 前 沿 、 


意义 。 在 大 科学 时 代 , 很 多 科学 问题 的 解决 已 经 不 再 
局 限于 某 一 个 学 科 。 因 此 ,研究 前 沿 是 指 某 一 个 研究 
领域 的 前 沿 , 有 可 能 涉及 多 个 学 科 , 甚 至 是 跨 学 科 的 。 


ir 
沿 研究 前 沿 


P 


pU 4 


前 沿 、 学 科 前 沿 之 间 的 关系 


图 2 研究 前 沿 与 科学 


3 ”研究 前 沿 识 别 主 要 研究 内 容 


本 文 主要 关注 如 何 识别 学 科 领 域 研究 前 沿 , 即 从 
方法 论 的 角度 出 发 探讨 采用 何 种 方法 .手段 从 学 科 领 
域 主题 中 进一步 抽取 具有 高 新 前 性 、 高 发 展 潜力 以 及 
高 影响 力 的 主题 ,并 将 其 用 于 推进 有 前 瞻 价 值 的 课题 
开发 。 在 调研 国内 外 相关 研究 的 基础 上 从 研究 前 沿 识 
别 方法 、 新 方向 两 方面 对 其 进行 归纳 总 结 ,其 中 识别 方 
法 研究 从 定性 、 定 量 两 个 视角 对 研究 前 沿 概念 提出 至 
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今 使 用 最 为 广泛 .研究 最 为 成 熟 的 经 典 方法 及 其 改进 
方法 进行 介绍 ,这 部 分 研究 是 研究 前 沿 识别 的 基石 及 
后 续 研 究 得 以 成 功 开展 的 基础 ;新 方向 是 在 机 器 学 习 
及 大 规模 文本 处 理 技术 迅速 发 展 的 背景 加 持 下 ,对 已 
有 研究 前 沿 识别 方法 的 新 拓展 ,是 未 来 研究 的 新 思路 。 
3.1 研究 前 沿 识 别 方法 研究 
自 D. J. Price 将 研究 前 沿 概念 引入 科技 领域 ,学 
者 就 其 概念 内 涵 识别 方法 进行 了 多 方面 的 摸索 和 控 
讨 ,主要 方法 包括 定性 判读 及 定量 计算 ,其 中 定量 方法 
主要 从 引文 网 络 分 析 角 度 展开 。 本 小 节 在 概述 相关 定 
性 研究 基础 上 ,主要 对 定量 分 析 进 行 总 结 ,首先 对 研究 
前 沿 识别 的 3 大 视角 :直接 引用 、 共 被 引 分 析 文献 看 
合 思想 的 提出 .方法 流程 .经 典 研究 进行 概括 ;其 次 对 
3 天 方法 性 能 对 比方 法 改进 等 研究 进行 归纳 ;以 上 分 
析 撞 基于 文献 层面 ,存在 固有 缺陷 ,而 基于 词 包 的 分 析 
方 注 可 作为 引文 分 析 方 法 的 补充 或 蔡 代 方法 , 故 最 后 
Ff 究 前 沿 识别 方法 的 另 一 个 分 支 基于 词 禾 的 识别 进 
通行 总 结 , 以 期 更 加 全 面 .系统 地 梳理 研究 前 沿 识别 
训 淋 体系 脉络 。 
SQ 基于 主观 数据 的 专家 判读 研究 前 沿 识别 
CJ 德尔 非法 广泛 适用 于 专项 及 综合 性 科技 研究 的 长 
期 如 势 预测 , 故 目前 德尔 非法 是 研究 前 沿 识别 领域 最 
党 用 的 方法 之 一 。 与 德尔 菲 法 相似 的 技术 预见 方法 还 


行 反复 的 问卷 调查 ,可 直接 向 专家 征求 意见 ,操作 较为 
方便 ,大 大 节约 了 时 间 ,但 也 容易 造成 识别 结果 缺乏 民 
主 化 和 社会 化 ,准确 性 不 能 实现 最 大 化 等 问题 下 。 此 
外 ,也 有 大 量 研究 将 访谈 与 引文 分 析 结果 结合 使 用 ,并 
指出 访谈 是 一 种 至 关 重要 的 意义 构建 工具 ””。 如 
S. Upham 45 Jt jj T 30 名 研究 人 员 ,访谈 时 间 为 
30 分 钟 至 2 小 时 不 等 。 目 前 ,在 研究 前 沿 识别 的 研究 
中 ,无 论 前 期 核心 文献 集 闭 值 的 设 定 ,还 是 后 期 量化 分 
析 结 果 的 解读 和 修正 均 需 专家 的 参与 。 但 以 上 方法 由 
于 甄选 专家 的 信息 源 和 分 析 信 息 的 方法 存在 缺陷 ,所 
以 存在 准确 性 及 可 靠 性 较 低 、 客 观 性 较 差 等 缺陷 。 随 
着 数据 密集 成 为 各 学 科 的 显著 特点 ,如 何 使 量化 分 析 
结果 更 好 地 辅助 专家 决策 ,专家 在 研究 前 沿 识别 中 如 
何 发 挥 作用 、 怎 么 发 挥 作用 均 是 进一步 研究 的 方向 。 


3.1.2 基于 目标 文献 及 其 前 向 后 向 引文 的 研究 前 沿 
识别 


随 着 科技 文献 的 迅速 积累 ,科学 计量 方法 成 为 定 
量 识别 研究 前 沿 的 重要 手段 。 通 过 对 已 有 研究 前 沿 识 
别 相关 文献 的 调研 发 现 ,引文 分 析 法 是 研究 前 沿 识别 
中 发 展 最 早 、 理 论 基 础 最 扎实 、 使 用 最 广泛 的 方法 之 
一 。 因 引文 分 析 按照 不 同 的 引用 关系 类 型 可 划分 为 直 
接 引 用 ` 共 被 引 、 文 献 耦 合 三 种 , 故 现 有 研究 多 从 以 上 
三 种 视角 展开 。 表 2 为 三 种 引文 分 析 方 法 的 含义 辨析 


头脑 风暴 法 和 专家 咨询 法 ,这 两 种 方法 不 需要 进 | 及 其 用 于 研究 前 沿 识别 的 分 析 流程 : 
表 2 三 种 引文 分 析 方法 含义 辨析 及 其 用 于 研究 前 沿 识别 的 分 析 流 程 
C3| 文 类 型 直接 引用 (Direct Citation) 共 被 引 分 析 ( Co-Citation Analysis ) 文献 耦合 (Bibliographic Coupling) 
T QQ © 9 
图 解 D 
© (E © 
分 析 流程 中 数据 下 载 :确定 研究 领域 和 时 间 窗 口 ,从 ”数据 下 载 :确定 研究 领域 和 时 间 窗 口 ,从 ”中 数据 下 载 :确定 研究 领域 和 时 间 窗 口 ,从 

数据 库 平 台 下 载 目标 文献 及 其 参考 文献 “数据 库 平 台 下 载 目 标 文 献 及 其 施 引 文献 “数据 库 平台 下 载 目标 文献 及 其 参考 文献 
集合 ; 集合 ; 集合 ; 
@ 引 用 对 识别 :识别 数据 集中 的 引用 关系 ” @ 高 被 引 目标 文献 筛选 : 因 引 用 频次 大 小 受 ”@ 数 据 筛选 :剔除 引用 频次 过 高 的 参考 文 
对 ,剔除 没有 引用 或 未 被 引用 的 文献 ; 才 间 影响 , 故 对 目标 文献 及 其 施 引 文献 按 年 。 献 ,避免 耦合 过 度 聚 合 ; 
@ 相 似 度 计算 :根据 文献 间 引 用 频次 大 小 计 ”进行 分 组 ,对 于 每 个 年 度 集合 ,按照 一 定 规 ”@@ 相 似 度 计算 :根据 不 同 目标 文献 同时 引用 
算 相似 度 ; 则 对 目标 文献 进行 筛选 ,如 遵 选 满足 引用 时 相同 参考 文献 频次 计算 两 篇 目标 文献 之 间 
@ 肾 类 :根据 相似 度 大 小 对 目标 文献 进行 聚 — d =0, 被 引 频次 > =3 或 引用 时 沾 <3, 被 ”相似 性 ; 
类 ,并 形成 文献 簇 ; 引 频 次 > = 引用 时 滞 +1, 或 被 引 频次 > =5 — @ 聚 类 :根据 相似 度 大 小 对 目标 文献 进行 聚 
@@ 命 名 :对 不 同文 献 秘 进 行 主题 命名 的 目标 文献 为 高 被 引文 献 集合 [25] ; 类 ,并 形成 文献 耦合 复 ; 

图 相似 度 计算 :根据 不 同 目标 文献 被 施 引文 “名 命名 :对 不 同文 献 复 进行 主题 命名 

献 共同 引用 频次 计算 两 篇 目标 文献 之 间 相 

WE; 

多 聚 类 :根据 相似 度 大 小 对 目标 文献 进行 聚 

类 ,并 形成 共 被 引文 献 徐 , 若 网 络 平均 度 中 

心 度 过 高 ,可 通过 设置 不 同 目标 文献 间 相似 

度 阔 值 大 小 对 网 络 进行 裁剪。 


曲 命 名 :对 不 同文 献 艇 进行 主题 命名 
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KE, KER, PAH, T. 学 科 领 域 研究 前 沿 识别 方法 研究 进展 [可 . 图 书 情报 工作 ,2022 ,66(12) :139 - 151. 


(1) 直接 引 用 (Direct Citation), E. Garfield?" 于 
1963 年 指出 直接 引文 分 析 法 可 作为 评估 科学 发 现 影 
响 力 的 关键 方法 ;D. J. Price 以 近期 发 表 且 频繁 被 
直接 引用 的 文献 集 为 研究 对 象 ,对 研究 前 沿 主题 进行 
了 识别 ;R，Klavans 等 ”指出 直接 引用 可 揭示 某 一 领 
域 的 研究 现状 及 未 来 发 展 趋势 。 但 由 于 直接 引用 需要 
较 长 的 时 间 窗 口 以 获得 足够 的 引用 来 保证 聚 类 效果 ， 
故 未 能 得 到 广泛 使 用 。 

(2) 共 被 引 分 析 ( Co-Citation Analysis) 。 若 论文 
E 论文 了 (不 论 其 各 自发 表 的 时 间 ) 同时 被 论文 A 引 
用 , 则 称 论文 ,论文 了 之 间 存 在 共 被 引 关系 , 共 被 引 
强度 是 指 同时 引用 论文 了 ,论文 的 论文 篇 数 ,篇 数 越 
多 , 则 两 篇 共 被 引文 献 的 相关 程度 越 高 。 共 被 引 是 前 
瞻 性 的 , 共 被 引 强度 随时 间 推 移 可 能 发 生变 化 。ESI 

和 省 采用 共 被 引 分 析 方法 进行 领域 前 沿 预 测 , 具 体 以 
成 锋 的 .被 频繁 共同 引用 的 高 被 引 论文 为 研究 对 象 。 
HCsmall"! 于 1973 年 提出 可 基于 文献 共 被 引 关 系 探测 
[前沿 ,他 认为 共 被 引 关系 比 直接 引用 更 能 客观 表 
征 秋 学 的 智力 和 社会 认 知 结构 ;1974 年 H. Small fil B. 
Garfield 等 人 ”利用 该 方法 对 文献 相似 性 进行 
2 区 证 分 析 ,并 可 视 化 展示 了 聚 类 结果 ;1985 年 ,他 对 
该 为 法 进行 了 进一步 修正 , 提出 分 数 共 被 引 聚 类 
(fonat Co-Citation Clustering) 用 以 消除 由 于 每 篇 论 
文 蜀 参考 文献 数目 不 同 而 对 聚 类 结果 的 影响 5 SL V. 
Maffshakova ”也 于 1973 年 指出 相 比 于 文献 碍 合 ( 回 尖 
PEDRE) , 共 被 引 (前 瞻 性 研究 ) 分 析 方法 更 加 复杂 ,也 
更 能 揭示 研究 前 沿 的 演化 特征 。 但 基于 共 被 引 的 研究 
前 酒 识别 方法 也 存在 一 定 的 缺陷 :研究 前 沿 只 有 在 施 
引文 献 数量 达到 一 定 规模 时 才 可 被 监测 出 来 ,具有 一 
定 的 时 间 灌 后 性 , 即 共 被 引 方法 不 能 在 某 个 研究 前 沿 
出 现时 实现 立刻 识别 ,而 是 只 能 在 领域 发 展 的 某 个 后 
期 发 现 它 。 共 被 引 聚 类 是 一 种 先 验方 法 ,以 某 领 域 高 
被 引 论文 为 研究 对 象 , 根 据 论 文 间 共 引 模式 进行 聚 类 ， 


过 耦合 强度 高 的 ` 刚 发 表 论文 的 聚 类 可 识别 领域 早期 
发 展 态势 , 比 共 被 引 分 析 更 具 优 势 , 他 通过 文献 耦合 方 
法 识别 出 了 阿尔 北海 默 证 富 勒 烯 等 领域 的 研究 前 沿 ， 
经 专家 咨询 证 实 该 方法 可 为 研究 前 沿 的 识别 提供 重要 
参考 ;M. H. Huang 等 站 以 2000 -2009 年 的 高 被 引 论 
文 为 例 ,使 用 文献 耦合 方法 探测 了 有 机 发 光 二 极 管 的 
研究 前 沿 ,认为 文献 耦合 方法 识别 出 研究 前 沿 与 该 领 
域 专家 的 观点 是 契合 的 ;SA Morris 等 ”以 炭 盖 数 
据 为 例 ,利用 文献 耦合 方法 识别 并 描绘 了 该 领域 研究 
前 沿 的 演化 趋势 ,技术 预测 专家 小 组 认为 该 研究 结果 
是 有 价值 的 。 因 文献 耦合 是 回溯 性 的 ,耦合 强度 是 固 
定 不 变 的 , 故 相 比 于 共 被 引 分 析 ,该 方法 动态 性 较 弱 ， 
且 两 篇 文献 可 能 引用 同一 文献 的 不 同 内 容 , 故 也 可 能 
造成 耦合 强度 虚 高 的 假象 。 

在 3 大 方法 相继 被 提出 后 ,学 者 又 从 不 同方 法 性 
能 比较 .方法 的 融合 和 改进 方面 进行 了 更 深入 的 探讨 ， 
具体 研究 如 下 : 

(1) 对 比分 析 以 上 3 种 研究 方法 性 能 。 部 分 研究 
表明 直接 引用 能 得 出 更 有 意义 的 研究 结果 ,如 N. Shi- 
bata 等 “以 氮 化 锋 、 复 杂 网 络 和 碳 纳米 管 为 研究 对 
象 ,对 比分 析 了 直接 引用 、 共 被 引文 献 耦合 三 种 方法 
在 识别 领域 研究 前 沿 的 优 缺 点 ,结果 表明 直接 引用 能 
导出 更 为 准确 的 研究 前 沿 ,引文 耦 合 比 共 被 引 更 能 监 
则 出 研究 前 沿 。 部 分 研究 表明 共 被 引 分 析 识 别 效 果 更 
好 ,如 J. Sharabchiev59 以 1981 年 免疫 学 主题 相关 文 
献 为 研究 对 象 ,对 比分 析 了 共 被 引 和 文献 耦合 方法 所 
识别 的 研究 前 沿 主题 网 络 ,结果 显示 共 被 引 分 析 比 文 
献 耦 合 在 绘制 免疫 学 主题 科学 图 谱 方面 表现 更 好 。 部 
分 研究 表明 文献 耦合 识别 效果 更 好 ,如 B. Jarnev- 
ing ^ 六 认 为 相 较 于 共 被 引 分 析 ,文献 耦合 得 出 的 主题 
更 加 微观 上 且 更 具有 可 解释 性 ;M. H. Huang 等 “采用 
文献 耦合 和 共 被 引 两 种 方法 分 析 有 机 发 光 二 极 管 领域 
研究 前 沿 的 演变 情况 ,结果 表明 两 种 方法 均 可 用 来 追 
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但 若菜 领域 无 论文 被 高 度 引 用 , 则 无 法 有 效 识 别 该 领 
域 的 研究 前 沿 。 

(3) 文 献 耦 合 ( Bibliographie Coupling) 。 该 词 最 先 
由 Fano 提出 ,M，M. Kessler? 于 1962 年 对 相关 概念 
进行 了 界定 ,他 指出 ,文献 耦合 理论 的 基本 出 发 点 为 共 
同 引用 一 篇 或 多 篇 文献 的 两 篇 文献 之 间 必 存在 相关 关 
系 , 即 若 论 文 A dex B 同时 引用 了 一 篇 或 多 篇 相同 的 
文章 , 则 称 论文 A 和 论文 B 之 间 存 在 文献 耦合 关系 。 
耦合 强度 是 指引 用 相同 文献 的 篇 数 ,相同 篇 数 越 多 ,两 
篇 耦合 文献 的 相关 程度 越 高 。 观 .Glanzel 等 ”认为 通 


踪 研 究 前 沿 的 演变 ,但 文献 耦合 能 比 共 被 引 更 早 地 更 
多 地 识别 研究 前 沿 , 性 能 更 佳 。 部 分 研究 则 表明 三 种 
方法 没有 显著 差异 ,如 K. W. Boyack 等 以 生物 医学 
领域 文献 为 例 , 分 别 采用 直接 引用 、 共 被 引 分 析 、 文 献 
耦合 ,引文 -文本 混合 方法 识别 研究 前 沿 ,结果 表明 每 
种 方法 均 可 被 认为 是 能 够 识别 生物 医学 研究 前 沿 的 一 
种 方法 。 总 体 来 看 ,由 于 分 析 单 元 选择 的 不 同 .研究 对 
象 的 差异 等 原因 ,以 引文 分 析 为 基础 的 .不 同 的 前 沿 识 
别 方法 可 能 得 出 不 同 的 识别 效果 ,但 三 种 方法 是 可 以 
互 为 补充 的 , 以 提供 更 为 全 面 的 领域 研究 前 沿 知识 
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结构 。 
《2) 改 进 现 有 方法 或 方法 间 交 叉 融 合 。 这 部 分 的 
探讨 旨 在 提高 识别 结果 的 可 读 性 、 精 确 度 ,主要 切入 点 
包括 增加 相关 字段 信息 、 划 分 不 同时 间 窗 口 .融合 多 种 
研究 方法 等 ,具体 研究 包括 :D， Zhao 等 ”提出 作者 看 
合 分 析 方 法 ( Author-Bibliographie Coupling Analysis, 
ABCA) ,并 将 其 应 用 于 信息 科学 领域 ,通过 将 识别 结 
与 作者 早期 提出 的 作者 共 被 引 分 析 方法 ” (Co-Cited 
Authors , ACA) 进行 对 比 ,结果 显示 二 者 各 有 所 长 ,结合 
分 析 更 有 可 能 获得 研究 领域 知识 结构 的 全 貌 ;C. Chen 
等 ”提出 了 一 套 结合 作者 共 引 分 析 和 参考 文献 共 引 
分 析 的 方法 体系 ,可 更 灵活 、 更 高 效 地 命名 共 被 引 聚 类 
类 团 ;K，W，Boyack 等 ”” 基 于 共 被 引 分 析 方 法 创建 


关 出 版 物 ,相关 关键 词 的 频次 也 会 越 来 越 高 。 学 者 试 
图 利用 词 频 统计 的 方法 以 更 直接 的 方式 发 现 更 有 价值 
的 研究 前 治 。 现 有 的 相关 识别 方法 主要 包括 基于 词 频 
( 突 发 词 ) 的 前 沿 识别 、 基 于 共 词 的 前 治 识别 ,具体 研 
究 内 容 如 下 : 

(1) 基于 词 频 ( 突 发 词 ) 的 前 治 识别 。 随 着 突 发 词 
监测 (Burst Term Detection ,BTD ) 在 文本 挖掘 中 的 大 量 
应 用 ,传统 科学 计量 学 开始 使 用 突 发 词 监测 技术 探究 
相关 领域 的 研究 前 沿 。 容 发 词 指 文本 流 中 频率 突然 激 
增 的 某 个 或 某 组 单词 ,可 用 单词 本 身 的 频次 变化 和 突 
发 出 现 的 时 间 间 隔 来 表征 “ o J. Kleinberg 指出 某 
主题 出 现 是 伴随 着 某 些 特征 频率 急剧 上 升 的 , 即 某 领 
域 研究 主题 的 出 现 是 存在 “活动 爆发 "标志 的 ,并 开发 


is 


了 高 度 详细 ,动态 的 全 球 科学 地 图 ,同时 为 了 使 研究 前 
沿 结果 可 解释 性 更 强 ,其 试图 通过 考量 不 同 被 引 频次 
\ 不 同时 间 切 片 ` 不 同 布局 算法 .是 否 纳入 文献 而 
合 江 法 等 多 种 情形 以 提高 识别 结果 准确 性 。 
由 上 文 分 析 可 知 , 共 被 引 分 析 倾向 于 以 发 表 年 限 
的 文章 作为 聚 类 对 象 ,而 不 能 有 效 涵盖 尚未 被 引 
用 本 发 表 年 限 较 短 的 文章 ,文献 业 合 则 倾向 于 以 发 表 
包 限 较 短 的 文章 作为 隧 类 对 象 , 而 不 能 有 效 涵盖 被 引 
用 鸭 发 表 年 限 较 长 的 文章 。 相 比 而 言 , 直 接 引用 则 可 
在 蓝 个 时 间 窗 口内 更 均匀 地 对 所 有 文献 进行 聚 类。 但 
READ ,物力 的 影响 ,三 种 方法 均 以 达到 一 定 被 引 频 
次 谣 看 合 强度 的 文献 为 研究 对 象 ,不 能 全 面 分 析 可 能 
与 鹃 研究 前 沿 相关 的 所 有 文献 。 如 M. H. Huang 
AE. 在 研究 中 将 耦合 强度 阔 值 设 定 为 5,ESI 按照 总 被 
引 贤 次 进行 排序 ,提取 排 在 每 个 ESI 学 科 前 10% 的 最 
具 引 文 影响 力 的 论文 集 作为 研究 对 象 。 这 可 能 会 造成 
部 分 研究 前 沿 相关 文献 的 丢失 ,进而 造成 部 分 前 沿 主 
题 的 遗漏 ;其 次 ,由 于 引用 动机 、 引 用 位 置 等 的 不 同 , 同 
一 文献 艇 中 的 文献 可 能 相似 度 较 低 ,从 而 造成 对 前 沿 
识别 的 误 判 ;最 后 ,三 种 方法 均 无 法 直接 对 类 团 进行 命 
名 ,主题 能 的 命名 方式 大 多 还 是 基于 对 筛选 出 的 主题 
文献 题目 ,关键 词 以 及 摘要 解读 基础 上 的 人 为 命名 , 存 
在 较 大 的 主观 性 ,需要 各 领域 专家 学 者 对 此 进行 进 一 
步 修正 。 
3.1.3 ”基于 词 簇 的 研究 前 沿 识 别 

基于 引文 的 研究 前 沿 识别 分 析 单元 为 高 被 引文 
献 , 低 被 引 或 零 被 引文 献 很 难 被 纳入 分 析 范畴 。 为 克 
服 引文 分 析 的 这 一 缺陷 ,部 分 学 者 开始 将 研究 视角 聚 
焦 于 更 细 粒 度 的 词 簇 方 向 。 鉴 于 学 者 对 研究 前 沿 的 关 
注 , 某 领域 研究 前 沿 出 现 后 ,将 会 随 之 涌现 出 大 量 的 相 


突 发 词 监测 算法 识别 那些 密度 突然 变 大 、 词 频 突然 变 
高 的 词 ; 陈 超 美 使 用 Kleinberg 算法 将 突 发 词 监测 整合 
到 CiteSpace 中 ,并 指出 文献 集中 的 突 发 词 可 部 分 展示 
某 研究 主题 的 潜在 前 沿 '" ;M. N. Li 等 ” 为 增强 传统 
共 词 分 析 结 果 , 引 入 突 发 词 监测 ,构建 了 关键 词 与 突 发 
词 间 的 关联 规则 挖掘 模型 ,研究 结果 被 证 实 可 作为 传 
统 研究 前 沿 识别 的 有 效 补充 。 与 传统 高 频 词 不 同 , 突 
发 词 更 加 强调 频次 突然 增高 的 词 ,结合 研究 前 沿 的 定 
义 , 传 统 高 频 词 分 析 识 别 研究 热点 , 突 发 词 分 析 更 可 能 
识别 出 研究 前 沿 。 但 突 发 词 监测 的 关键 在 于 能 否 准确 
识别 出 突 发 词汇 ,时间 切 片 .频次 阔 值 等 的 选择 均 会 对 
监测 效果 产生 重要 影响 ,相同 突 发 词 监测 算法 应 用 到 
不 同 研究 领域 也 可 能 得 到 不 同 的 准确 率 ,虽然 研究 者 
们 一 直 在 尝试 开发 不 同 算法 以 提高 监测 水 平 ,但 目前 
尚未 形成 一 个 普 适 性 的 监测 算法 。 

(2) 基 于 共 词 的 前 沿 识别 。 因 论文 通常 需要 时 间 
才能 被 其 他 论文 所 引用 , 故 基于 引文 分 析 的 人 研究 前 沿 
识别 方法 很 难 把 握 领 域 最 新 趋势 ,而 共 词 网 络 在 论文 
发 表 的 第 一 时 间 即 可 迅速 构建 完成 , 故 可 及 时 发 掘 研 
究 前 沿 。 由 于 单个 关键 词 可 能 会 削弱 研究 主题 的 语义 
表达 , 故 研 究 主题 通常 是 由 一 组 共 现 词 篮 构成 , M. 
Callon 45: 于 1986 年 出 版 了 第 一 部 关于 共 词 分 析 的 
学 术 专 著 , 被 认为 是 该 研究 领域 的 里 程 碑 式 工作 。 共 
词 分 析 首 先 将 数据 集 划 分 为 不 同时 间 段 的 子 集 , 并 以 
论文 标题 .摘要 等 内 容 的 关键 词 作为 研究 对 象 ;其 次 统 
计 不 同 关键 词 对 在 论文 中 同时 出 现 的 频率 ;最 后 绘制 
各 时 间 段 的 关键 词 对 共 现 网 络 图 谱 。 共 词 网 络 中 的 节 
点 对 应 于 关键 词 , 边 对 应 于 关键 词 间 的 共 现 关系 。 共 
词 分 析 方 法 通常 用 一 般 通用 的 、 频 繁 出 现 的 关键 词 对 
表征 研究 主题 ,如 本 Joung 等 ”通过 层次 聚 类 算法 对 
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关键 词 相关 矩阵 进行 聚 类 分 析 , 结 果 表 明 可 以 通过 关 
键 词 对 识别 研究 前 沿 技术 。 但 这 些 稳定 的 关键 词 对 可 
能 会 干扰 那些 具有 特异 性 的 、 突 然 引 起 注意 的 .具有 特 
定时 期 特征 的 研究 主题 的 发 现 ,而 这 些 爆炸 性 的 研究 
主题 往往 更 能 代表 领域 的 研究 前 沿 。 为 克服 这 一 商 
端 ,M，Katsuraif5 开发 了 TrendNets 算法 ,通过 计算 连 
续 两 个 时 间 段 关键 词 共 现 频率 的 差异 以 快速 监测 动态 
共 词 网 络 中 边缘 权 值 的 变化 ,进而 识别 出 那些 在 某 一 
时 间 段 被 广泛 讨论 .而 在 之 前 时 间 段 未 被 广泛 讨论 的 
主题 。 但 目前 研究 中 仍 大 多 采用 传统 共 词 分 析 法 , 即 
利用 关键 词 词 频 统计 和 高 频 词 聚 类 识别 某 领域 的 研究 
前 沿 ,该 方法 提取 出 的 研究 主题 更 偏向 于 研究 热点 。 
同时 因 共 词 分 析 同 样 基于 关键 词 ,忽略 了 文章 的 语义 
信息 , 故 研究 者 开始 尝试 利用 主题 模型 等 机 器 学 习 方 
提高 研究 前 沿 识别 结果 中 的 语义 信息 。 
基于 词 入 的 研究 前 沿 识别 方法 所 识别 出 的 研究 主 
题 并 不 能 被 直接 定义 为 研究 前 沿 主题 ,需要 专家 的 进 
判读 或 结合 其 他 研究 前 沿 识别 方法 。 相 关 研 究 将 
词 毕 分 析 方 法 与 引文 分 析 方 法 相 结合 。 首 先 通过 引文 
符 阴 方法 识别 出 领域 高 被 引文 献 集 ,其 次 以 该 文献 集 
光电 究 对 象 ,运用 相关 词 艇 分析 方法 挖掘 出 相关 前 沿 
JOB. WR. R. Braam 等 "将 词 频 分 析 方 法 与 共 被 引 
分 榨 方 法 相 结合 ,通过 对 高 被 引文 献 集合 标题 ,摘要 的 
词 频 分 析 识 别 出 研 究 前 沿 ; 侯 海燕 等 结合 共 词 分 析 
这 被 引 分 析 ; 周 立 英 等 1 结合 共 词 分 析 与 引文 看 
A. Van den Besselaar Akla] 结合 词 频 分 析 与 共 被 引 
AM. 不 同方 法 间 的 结合 能 够 有 效 弥补 单一 方法 存在 
的 夸 陷 ,已 成 为 目前 研究 前 沿 识别 领域 使 用 较 多 的 
方法 。 
3.2 ”研究 前 沿 识别 新 方向 

除 上 述 常见 的 .主流 的 方法 外 , 随 着 各 类 型 数据 库 
的 不 断 完善 .机 器 学 习 算 法 的 兴起 ,学 者 在 已 有 研究 的 
基础 上 ,对 研究 前 沿 识别 方法 进行 多 方面 的 探索 ,试图 
进一步 丰富 研究 对 象 提高 主题 有 效 性 、 可 读 性 ,进而 
使 得 识别 结果 更 加 贴 合 实际 ,更 好 服务 决策 。 
3.2.1 基于 多 源 数据 的 研究 前 沿 研 究 对 象 

在 科学 研究 进入 第 四 范式 的 大 背景 下 ,基于 大 数 
据 的 知识 发 现成 为 科技 领域 知识 发 现 的 重要 形式 ,这 
些 数据 一 般 以 数据 库 的 形式 被 规范 存储 以 实现 数据 共 
享 ,最 常见 的 数据 库 包括 科技 论文 数据 库 、 专 利 数据 
库 , 近 年 来 一 些 科技 项 目 数据 库 也 逐渐 落地 。 科 学 研 
究 的 研究 主体 为 团队 或 个 人 ,研究 产 出 为 团队 或 个 人 
为 解决 实践 问题 集成 多 学 科 知识 而 产 出 的 论文 专利、 


专著 ,项目 等 内 容 , 故 仅 将 论文 作为 主题 识别 的 研究 载 
体会 使 前 沿 识别 结果 存在 局 限 性 ,也 削减 了 其 前 脆性 
价值 。 为 改善 这 一 研究 局 限 ,部 分 学 者 开始 以 融合 的 
多 源 数据 作为 研究 前 治 识别 的 分 析 对 象 ,虽然 研究 对 
象 进 一 步 丰富 ,但 其 研究 前 沿 识别 方法 和 思路 基本 一 
致 ,不 同 之 处 在 于 需 根 据 数据 的 本 质 差别 对 具体 指标 
数值 .数值 大 小 的 意义 以 及 识别 出 来 的 前 沿 类 型 进行 
区 分 。 如 白 如 江 等 ”指出 已 发 表 的 论文 多 为 对 未 解 
的 科学 问题 所 做 的 种 种 探索 并 取得 了 重大 或 一 定 进 
步 ,这 部 分 主题 为 “过 去 式 ” 的 研究 前 沿 , 而 基金 项 目 
包含 未 解决 的 、 近 期 正在 进行 的 .具有 明确 研究 目标 和 
方法 路 径 的 研究 前 沿 ,为 “进行 时 ”的 研究 前 沿 ,科技 
规划 中 则 包括 “未 来 时 "的 研究 前 沿 ; 张 精 等 ” 以 科技 
创新 型 国家 重大 科研 项 目 数据 资料 归 集 为 基础 ,从 项 
目 名 称 及 关键 词 项 目 摘要 、 项 目 所 属 科研 计划 三 方 盏 
探索 了 基于 科研 项 目 数据 的 研究 前 沿 ; 邓 启 平 ” 以 中 
国 计 算 机 协会 推荐 的 人 工 智能 领域 A 类 、B 类 期 刊 和 
会 议论 文 为 数据 源 ,结合 指标 阐 值 六 选 研 究 前 沿 ;I 
Park 等 ”以 专利 和 论文 为 数据 源 ,分 别 捕捉 不 同类 型 
研究 前 沿 ; 曾 海 娇 等 ” 基于 专利 与 论文 关联 细 粒 度 识 
别 生物 农药 领域 的 潜在 研究 前 沿 。 部 分 学 者 认为 引文 
分 析 等 方法 不 可 避免 地 面临 着 时 间 清 后 等 缺陷 ,进而 
引入 Altmetrics 数据 源 以 即时 客观 地 反映 论文 影响 力 ， 
结果 表明 以 该 方法 识别 出 的 主题 与 已 有 传统 方法 相 比 
在 社会 关注 层面 具有 更 高 的 前 沿 性 ,归纳 总 结 已 有 
研究 涉及 的 数据 源 见 图 3。 某 领域 制定 的 科技 规划 将 
会 促进 相关 主题 基金 项 目的 申报 ,依托 于 基金 项 目 也 
会 有 论文 文献 的 产 出 ,进而 促进 专利 技术 的 产 出 、 转 
化 ,但 这 一 过 程 不 是 完全 线性 发 展 的 ,也 可 实现 逆向 促 
进 ,如 基金 项 目 或 论文 产 出 也 会 促进 新 的 科技 规划 的 
制定 。 总 体 来 看 ,目前 研究 前 沿 识别 仍 以 论文 数据 为 
主要 研究 对 象 ,未 来 可 进一步 扩大 数据 来 源 ,比较 同一 
领域 不 同 数据 源 前 沿 主题 识别 的 异同 ,进而 识别 出 不 
同类 型 的 研究 前 沿 主题 ,提供 更 加 有 效 的 前 沿 方向 。 
3.2.2 基于 多 维 指标 的 研究 前 沿 衡量 手段 

一 方面 ,有 学 者 认为 基于 引文 和 词 篮 的 研究 前 沿 
识别 均 侧 重 于 “如 何 测度 ”, 而 不 是 “如 何 识别 ”” ; 另 
一 方面 ,不 同学 者 对 于 研究 前 沿 的 本 质 特征 具有 不 同 
看 法 ,有 的 学 者 认为 ,研究 前 沿 应 是 在 继承 已 有 研究 的 
基础 上 开创 新 的 方法 777 ,有 的 学 者 则 认为 研究 前 沿 
应 更 多 突出 其 对 已 有 研究 的 破坏 性 ”” ,因此 为 了 多 
维度 全 面 识 别 研究 前 沿 ,学 者 试图 根据 研究 前 沿 的 概 
念 内 涵 ， 设 计 不 同 维度 的 科学 计量 指标 以 分 析 不 同 前 
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图 3 研究 前 沿 识别 涉及 的 各 类 数据 源 


沿 主 题 在 各 维度 的 表现 ,进而 将 前 沿 主题 划分 为 不 同 
类 型 ,为 决策 支持 提供 更 加 对 标 、 聚 焦 的 政策 建议 。 如 
S. Cozzens 等 "总结 归纳 了 研究 前 沿 的 4 个 主要 特 
ÎE ,分 别 为 近期 快速 增长 .对 新 事物 有 改变 、 市 场 或 经 
济 潜力 较 高 以 及 科学 性 不 断 增长 ,该 研究 作为 从 多 维 
指标 视角 测度 研究 前 沿 的 开山 之 作 , 为 研究 前 沿 识别 
提供 了 新 的 思路 。 后 续 学 者 又 从 不 同 维度 对 该 指标 体 


T 


RIT T HR TERMED, ATH. Guo 等 “认为 特定 单词 
ARRAI IS BER BEAR DR 3 FR c 
学 种 交 又 性 增强 可 作为 一 个 领域 是 否 为 研究 前 沿 的 标 
USB. Small 等 "认为 学 者 对 于 研究 前 沿 应 具备 新 颖 
性 快速 增长 性 几乎 已 达成 共识 ;D，Rotol 等 中 根据 
确 宛 前 沿 的 概念 内 涵 , 清 晰 界定 了 研究 前 沿 的 5 个 特 
征 \ 即 高 新 颖 性 相对 快速 增长 .连贯 性 .显著 影响 ,不 
HEFERIBHMIE A. L. Poner 团队 ”以 新 颖 性 , 持 
续 性 、 作 者 发 文 网 络 .增长 性 4 个 特征 作为 界定 研究 前 
没 酌 指标 体系 。 国 内 学 者 在 该 方面 也 进行 了 系列 研 
究 ( 不 过 指标 体系 多 为 在 上 述 研究 基础 上 进一步 的 系 
统 徐 。 归 纳 梳理 已 有 的 研究 前 沿 表征 维度 ,并 总 结 每 
一 维度 的 测度 指标 ,结果 如 表 3 所 示 。 

〇 通过 对 上 述 研究 的 进一步 梳理 ,基于 多 维 指标 的 
研究 前 沿 测度 具体 方法 流程 如 下 :首先 采用 上 文 或 下 
文 提 到 的 研究 前 沿 识别 方法 (如 引文 . 词 和 文本 聚 类 
算法 ) 识 别 出 某 领域 研究 前 沿 ; 其 次 根据 研究 前 沿 概念 
内 涵 构建 测度 框架 , 尽 可 能 地 使 所 提取 的 指标 可 以 表 
达 或 全 面 衡量 原 数据 的 信息 ;最 后 根据 指标 重要 性 进 
行 阐 值 划分 ,计算 各 主题 在 每 个 指标 下 的 得 分 分 值 并 
将 其 划分 为 不 同 的 前 沿 主题 类 型 ,如 白 如 江 等 "结合 
主题 强度 和 主题 新 颖 度 将 研究 主题 划分 为 热点 新兴、 
衰弱 ,潜在 四 种 不 同 的 研究 前 沿 主题 ; 刘 自强 "结合 
主题 新 兴 度 和 主题 关注 度 , 选 择 均 位 于 前 10% 的 主题 
为 研究 前 沿 主题 ; 范 云 满 等 "利用 发 文 量 、 被 引 量 .新 
颖 度 曲 线 的 交点 表征 主题 发 展 的 程度 ,将 LDA 主题 模 
型 识别 结果 与 混合 基线 相 比较 ,判读 主题 发 展 程度 , 进 
而 识别 出 研究 前 沿 主题 。 


综 上 , 现 有 研究 大 多 喜 括 了 前 沿 主题 识别 的 某 个 
或 某 几 个 维度 ,具体 以 3 -5 个 指标 居多 ,复合 指标 计 
算 复杂 难以 推广 ,至 今 未 能 形成 统一 ` 系 统 的 量化 体 
系 。 相 同 维度 测度 指标 的 选择 也 有 所 不 同 , 使 得 横向 
对 比 不 同 领域 前 沿 识别 结果 几乎 不 可 行 。 其 次 , 因 需 
人 工 指 定 各 指标 阀 值 范 围 , 且 各 维度 阔 值 设 定 的 准确 
性 也 需 进 一 步 验 证 ,这 使 得 不 同 前 沿 主题 类 型 的 划分 
存在 较 多 的 主观 性 。 
3.2.3 基于 机 器 学 习 算法 的 研究 前 沿 识别 方法 

机 器 学 习 的 准确 性 和 决策 效率 随 着 大 规模 文本 处 
理 技术 的 发 展 得 以 提高 ,近年 来 其 使 用 率 也 呈 指 数 级 
增长 ,机 带 学 习 算 法 应 用 于 研究 前 沿 识别 领域 主要 包 
括 文本 聚 类 文本 分 类 、 时 间 序 列 分 析 三 方面 ,其 中 文 
本 聚 类 主要 采用 非 监 督学 习 算法 ,并 将 其 应 用 于 文本 
主题 识别 ,与 传统 共 词 分 析 相 比 ,可 降低 关键 词 维度 ， 
提高 主题 词语 义 内 涵 和 可 解释 性 ;文本 分 类 主要 采用 
监督 学 习 算法 ,提前 预测 高 被 引文 献 集合 ,有 效 解 决 引 
文 时 沛 问题 ;时 间 序 列 分 析 主 要 以 测度 指标 随时 间 变 
化 趋势 为 数据 基础 ,通过 时 间 序 列 模型 预测 指标 未 来 
发 展 趋势 。 具 体 研 究 如 下 :中 基于 文本 聚 类 算法 的 前 
沿 主题 识别 。 随 着 数据 体 量 的 增 大 、 非 结构 化 数据 的 
增多 ,文本 主题 挖掘 技术 的 重要 性 日 益 突 显 。 文 本 主 
题 挖 掘 指 从 结构 化 , 半 结 构 化 或 非 结 构 化 的 文本 数据 
中 获取 有 价值 的 信息 和 知识 ,主要 包括 文本 收集 数据 
清洗 .特征 提取 特征 修剪 文本 聚 类 等 流程 ,为 了 考虑 
词 与 词 之 间 的 上 下 文 关系 ,学 者 在 特征 提取 SCA EIS 
等 方面 开发 不 同 的 算法 ,如 本 Yoon 等 ”提出 了 SAO 
结构 分 析 方 法 ,与 词 簇 分 析 方 法 相 比 , 按 语法 结构 组 织 
的 句子 能 清晰 描述 句子 组 成 部 分 之 间 的 关系 ”; 接 着 
不 同学 者 也 将 其 应 用 于 研究 前 沿 识别 中 ,识别 主题 更 
易于 理解 于 -79 ;W. M. Pottenger Amm 利用 神经 网 络 
模型 识别 出 了 数据 集中 新 出 现 的 概念 或 主题 ;A. Kon- 
tostathis BEI) 提出 了 Emerging Trend Detection 77 1 , HJ] 
首先 通过 共 词 分 析 展 示 不 同时 间 段 内 的 主题 ,其 次 使 
文本 挖掘 技术 根据 共 现 特征 进行 主题 抽取 、 分 类 ,最 
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雪 ， 
表 3 研究 前 沿 识别 多 维 测度 指标 
类 型 指标 介绍 
新 颖 性 测度 即时 性 探析 某 主题 参考 文献 及 其 引用 的 知识 基础 被 提出 或 正式 发 表 时 间 
新 颖 度 若 某 主题 内 文献 集群 发 表 年 份 越 新 ,说 明 该 研究 主题 新 颖 程度 越 高 
增长 力 测度 发 文 量 义 某 主题 内 发 文 年 增长 率 来 表征 
引用 影响 力 义 某 主题 内 发 文 被 引 增长 率 来 表征 
作者 数量 以 某 主 题 内 发 文 作者 增长 率 来 表征 
影响 力 测度 引用 影响 力 义 某 主 题 内 发 文 被 引 频次 来 表征 
创新 性 义 某 主 题 内 新 发 表 文 献 与 已 有 文献 的 知识 元 余 度 来 表征 
作者 数量 义 某 主 题 内 年 度 发 文 作 者 数量 来 表征 
公众 认可 测度 普遍 认可 性 某 主题 在 社交 媒体 平台 被 关注 .点 赞 、 转 发 次 数 ;或 在 学 术 论文 .报告 等 被 提 及 .引用 次 数 
权威 性 通过 主题 被 提 及 的 社交 媒体 或 社交 用 户 的 影响 力 ,刊载 学 术 论 文 或 报告 的 期 刊 或 科研 人 员 影 响 力 来 表征 
交叉 程度 测度 学 科 多 样 性 义学 科 丰 富 性 ,学科 平衡 性 ,学 科 差异 性 来 表征 
网 络 凝聚 性 久 某 主题 所 涉及 的 学 科 网 络 紧密 程度 和 各 学 科 在 网 络 中 位 置 的 差异 程度 来 表征 ,具体 指标 包括 包括 网 络 密 
度 、 网 络 中 心 势 .核心 -边缘 度 等 
了 其 他 二 级 指标 生命 周期 特征 义 某 主题 下 不 同 主题 词 在 时 间 轴 上 的 演化 趋势 来 表征 
> 基本 科学 指标 (ESI) 通过 对 近 十 年 内 高 校 及 科研 机 构 的 论文 统计 分 析 , 遵 选 热点 和 高 被 引 论文 ,以 此 为 数据 基础 ,剖析 领域 研究 
(© 前 沿 
LO 自然 指数 (Nature Index, NI) 由 自然 (Springer Nature) 旗 下 的 自然 科研 ( Nature Research ) 出 版 ,通过 追踪 高 质量 自然 科学 期 刊 所 发 表 的 科研 
~N 论文 作者 信息 ,为 科研 共同 体 提供 关于 世界 范围 内 科学 研究 现状 及 出 版 动向 的 信息 
e m 指数 ( Productivity Index) ”综合 同行 评议 和 论文 影响 力 等 定性 ,定量 指标 


= 综合 


局 梁 用 一 定 评价 标准 验证 主题 并 判断 其 发 展 趋势 ;为 
富 主 题 的 语义 结构 ,D. M. Blei 等 '” 提出 使 用 


i-n-grams 模型 提取 基于 术语 的 主题 。 以 上 衍生 的 多 

同 算法 均 使 得 研究 前 沿 主题 识别 结果 语义 更 加 丰 
富 @ 有 助 于 专家 的 进一步 理解 和 解读 。 书 基于 文本 分 
类 陋 前 沿 数据 集 预测 。 我 们 可 以 看 到 ,前 述 研究 大 多 
基 丢 高 被 引 论文 ,但 论文 被 引 量 的 累积 需要 一 定时 间 ， 
故 高 被 引 论文 集中 不 能 有 效 涵盖 最 新 发 表 但 未 来 可 能 
会 被 大 量 引用 的 文献 ,进而 导致 识别 出 的 研究 前 沿 
颖 性 无 法 保证 ,因此 采用 机 器 学 习 分 类 模型 及 早 预测 
价值 高 、 洪 力 强 的 文献 为 当下 及 未 来 研究 前 沿 识别 提 
供 新 的 研究 方法 。 如 C. Lee 等 中 基于 专利 数据 构建 
18 个 高 价值 专利 判别 指标 ,采用 前 馈 多 层 神经 网 络 模 
型 捕捉 输入 和 输出 指标 间 关系 ,进而 在 专利 申请 早期 
阶段 提前 预 判 具 有 研究 前 沿 特性 的 专利 ; 李 欣 等 ” 首 
先 通 过 构建 机 器 学 习 模型 来 识别 潜在 高 被 引 论文 ,其 
次 以 高 被 引 论文 集 为 数据 源 ,利用 聚 类 分 析 法 识别 研 
究 前 沿 主题 。@) 基 于 时 间 序 列 分 析 的 指标 演化 预测 。 
目前 该 方面 的 研究 处 于 初步 阶段 ,主要 研究 如 5S. Xu 
等 “将 研究 前 沿 指 标 界 定 为 新 颖 性 、 一 致 性 等 方面 ， 
分 别 计算 各 主题 不 同 指标 2001 -2017 年 演化 趋势 , 采 
用 时 间 序 列 分 析 模 型 多 任务 最 小 二 乘 支 持 向 量 机 预测 
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指标 未 来 2 年 变化 趋势 ,进而 预测 潜在 研究 前 沿 主题 ; 
与 上 述 研 究 思路 相似 , 李 静 等 LES CAR 分别 采 
支持 向 量 机 .ARIMA 模型 对 主题 趋势 预测 。 

从 基于 词 频 统 计 发 展 至 文本 聚 类 算法 ,从 基于 主 
观 设 定 一 定 阔 值 的 高 被 引文 献 集 发 展 至 提前 预测 洪 在 
高 被 引文 献 集 , 从 基于 特定 时 间 段 指标 计算 发 展 至 指 
标示 来 演化 趋势 预测 ,新 的 研究 前 沿 识别 方法 使 得 研 
究 主题 语义 信息 更 加 丰富 、 识 别 粒度 更 加 灵活 ,同时 克 
服 了 引文 分 析 的 时 间 清 后 性 缺点 ,而 且 识别 出 来 的 主 
题 更 加 具有 前 瞻 性 ,为 研究 前 沿 识别 提供 了 新 的 研究 
思路 和 测度 方法 。 


PU 


Cm 


4 总 结 与 展望 
本 文 从 研究 前 沿 发 展 背 景 . 相 关 概念 辨析 入 手 , 以 


E, 


研究 前 沿 识别 方法 .研究 前 沿 识别 关键 技术 为 视角 , 杭 
理 总 结 了 从 定性 .定量 方法 识别 研究 前 沿 主题 的 相关 
内 容 及 目前 研究 前 沿 识别 中 使 用 的 测度 指标 ,研究 对 


象 , 综 合 现 有 实践 和 研究 ,提出 以 下 不 足 并 对 未 来 发 展 
提出 展望 
4.1 研究 前 沿 相关 概念 需 进 一 步 明 晰 


目前 研究 前 沿 的 概念 尚 不 明晰 ,更 多 是 从 文献 的 
角度 界定 和 发 现 研究 前 沿 , 但 这 样 识别 出 来 的 “研究 前 
沿 "是 否 是 真正 意义 上 的 研究 前 沿 还 有 待 进一步 探讨 ， 
有 学 者 认为 目前 通过 文献 数据 所 测度 识别 出 的 研究 前 
沿 更 像 是 研究 焦点 。 但 毋庸 置疑 的 是 ,研究 前 沿 的 识 
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别 对 预测 科学 发 展 趋势 及 学 者 科研 方向 选择 都 有 重要 
意义 。 故 本 文 对 研究 前 沿 的 相关 概念 进行 了 辨析 , 试 
图 厘清 研究 前 沿 .研究 热点 .新 兴 研究 .科学 前 沿 及 学 
科 前 沿 之 间 的 关系 ,为 相关 学 者 开展 研究 前 沿 工作 提 
供 参 考 。 
4.2” 阅 值 设置 的 合理 性 有 效 性 需 进一步 验证 

研究 前 沿 识别 一 般 首 先 通过 设 定 被 引 频次 阔 值 性 
选 具有 代表 性 的 高 被 引文 献 为 研究 对 象 , 低 被 引 或 零 
被 引文 献 很 难 被 纳入 分 析 , 如 EST 研究 前 沿 报告 将 在 
同 出 版 年 .同学 科 论文 中 位 居 前 1% 的 论文 作为 高 被 
引 核 心 文献 集 ,Upham 等 ”以 各 学 科 被 引 频 次 排名 前 
1% 的 论文 为 研究 对 象 , 该 参数 可 根据 分 析 所 需 向 上 或 
向 下 调整 ,Glinzel ”将 文献 链接 超过 9 个 ,链接 强度 至 
少 为 0.25 的 文献 定义 为 核心 文献 , Huang 等 ”将 耦合 
强 座 闵 值 设置 为 5。 由 于 存在 时 间 灌 后 ,一 篇 文章 达 
到 巍 引 用 率 需 要 多 年 时 间 , 且 不 同学 科 情况 不 同 ;其 次 
阅 值 不 同 ,前 沿 主题 识别 结果 也 会 存在 差异 。 如 何 确 
冠 贺 值 大 小 一 直 没 有 明确 的 科学 依据 ,一 般 由 研究 者 
根据 数据 体 量 的 大 小 .前 沿 主题 数目 的 个 数 来 主观 确 
阔 值 设置 的 科学 性 、 合 理性 都 需 进 一 步 探讨 和 


P 
RN 


AN 研究 方法 的 适用 范围 需 进一步 界定 
J 如 果 我 们 把 研究 前 沿 的 本 质 看 作 是 面向 未 来 的 控 
索 * 那 么 研究 前 沿 应 该 是 一 个 动态 的 、 多 元 的 、 多 维 的 
概 您 。 但 目前 研究 前 沿 识别 数据 来 源 多 为 论文 及 其 引 
艾 瞧 据 , 同 时 为 确定 研究 前 沿 演化 趋势 ,研究 者 通常 会 
设 午 引 文 窗口 ,将 研究 时 间 范 围 划分 为 若干 区 间 , 由 于 
没有 准确 的 .公认 的 引文 窗口 ,研究 者 通常 根据 自己 的 
研 铭 目的 选择 引文 窗口 ,5 年 固定 窗口 最 常用 于 研究 
前 沿 的 研究 。 一 方面 被 引 次 数 受 发 表 时 间 、 作 者 引用 
动机 文章 可 获得 性 等 因素 的 影响 ,难以 逾越 时 滞 性 问 
题 , 故 现 有 研究 识别 出 的 主题 是 否 可 以 称 之 为 真正 意 
义 上 的 研究 前 沿 主题 仍 需 商 椎 ; 另 一 方面 由 于 突 发 词 、 
重 美 人 文献 的 存在 ,固定 时 间 窗 口 的 划分 能 否 有 效 圳 
括 某 领域 全 部 研究 前 沿 均 需 进一步 思考 。 未 来 研究 中 
可 考虑 融合 多 源 数据 ,捕捉 同一 领域 不 同 数 据 源 前 沿 
识别 主题 的 相同 或 互补 特征 ,同时 可 考虑 在 滑动 窗口 
下 的 主题 演化 趋势 中 识别 该 领域 前 沿 主题 。 
4.4 ”多 源 融合 数据 、 多 维 测度 指标 需 进一步 系统 化 
现 有 研究 主要 以 论文 数据 为 研究 对 象 ,部 分 研究 
加 入 了 基金 项 目 .科技 规 划 专利 等 补充 数据 源 。 不 同 
数据 源 具 有 不 同 的 数据 特色 ,有 研究 表明 同一 领域 论 
文 的 研究 主题 比 基 金 项 目 研 究 主题 平均 滞后 2 年 ,但 
现 有 研究 主要 将 不 同 数据 源 进行 简单 的 组 合 ,分 别 控 


un 


掘 各 数据 源 的 研究 主题 ,然后 结合 数据 源 自身 的 优势 
将 前 沿 主题 划分 为 不 同类 型 ,忽略 了 由 于 数据 源 本 身 
的 差异 所 导致 的 前 沿 主题 的 不 同 。 故 如 何 纳入 不 同 数 
据 源 的 差异 与 特色 ,将 同一 领域 不 同 数据 源 有 效 融 合 ， 
基于 融合 后 的 数据 矩阵 进行 聚 类 是 弥补 识别 结果 时 沸 
性 问题 的 突破 口 之 一 。 多 维 测度 指标 方面 ,全 面 考虑 
研究 前 沿 概 念 内 涵 本 质 的 多 维 指标 较 少 ,大 多 指标 计 
算 复 杂 、 难 以 推广 , 且 至 今 尚未 形成 统一 、 系 统 的 量化 
体系 , 故 应 进一步 明晰 研究 前 治本 质 , 结 合 不 同 特征 ， 
在 指标 尽 可 能 反映 研究 前 沿 全 要 素 基 础 上 简化 计算 方 
法 ,使 定量 分 析 结 果 最 大 化 地 客观 反映 研究 前 沿 主题 


的 本 质 。 
4.5 现 有 研究 前 沿 识别 结果 的 针对 性 、 价 值 性 需 进 一 
步 明 确 


首先 ,研究 前 沿 最 常见 的 共同 特征 是 它 有 可 能 改 

变 并 为 我 们 对 某 一 问题 的 认 知 注入 新 的 理解 ,从 某 种 

程度 来 说 ,研究 前 治 并 不 是 完全 可 计量 的 ,也 就 是 说 ， 

使 用 科学 计量 方法 识别 出 的 领域 研究 前 沿 主题 不 可 避 

免 地 存在 各 种 问题 ;其 次 ,目前 使 用 的 研究 前 沿 识别 方 

法 不 论 研究 前 期 \. 后 期 均 会 涉及 专家 的 参与 和 打分 ,但 

某 领域 科学 共同 体 对 于 该 领域 研究 前 沿 本 身 就 有 自己 

的 认 知 和 理解 ,因此 ,从 科学 计量 角度 识别 出 的 研究 前 

沿 对 于 这 些 研 究 人 员 而 言 真正 的 意义 和 价值 体现 在 哪 

里 需要 我 们 进一步 明确 。 综 上 ,我 们 应 该 明确 服务 对 

象 和 服务 目的 ,科学 计量 方法 主要 是 从 宏观 层面 提供 

相对 更 加 客观 的 趋势 性 信息 ,需要 领域 专家 以 计量 结 

果 为 基础 ,进一步 判读 计量 数据 背后 隐 含 的 信息 。 同 

时 对 于 识别 的 研究 前 沿 主题 范畴 来 说 ,我 们 应 聚焦 于 

识别 研究 者 可 能 会 忽略 的 .但 具有 潜在 价值 的 研究 前 

沿 ,希望 我 们 的 研究 可 以 抛砖引玉 ,吸引 更 多 研究 者 更 

加 关注 某 些 主题 ,也 为 研究 课题 的 选择 、 政 策 的 制定 提 

供 参 考 。 
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T Abstract: | Purpose/ Significance | Sorting out the relevant researches of domestic and foreign research front, 
fhis paper summarizes the problems existing in the existing researches, and provides references for the identification 
of the research front in the subject field. | Method/Process | This paper first summarized the necessity of research 
front identification, then discriminated the relevant concepts. Subsequently, based on the investigation of domestic 
and foreign relevant researches, this paper classified it from two aspects of the research methods of research front i- 
dentification and the new direction of research front identification, and finally put forward the existing research defi- 
ciencies and prospects for the future development. | Result/Conclusion | In terms of concept definition, the conno- 
tation of the research front is finally clarified by analyzing the series of concepts related to the research front from two 
perspectives of the time dimension and the definition scope. In terms of identification methods, classical research 
methods include direct citation, co-citation analysis, literature coupling, and word cluster-based methods for identif- 
ying research fronts; at the same time, research front identification based on multi-source data, multi-dimensional in- 
dicators and machine learning algorithms is a new direction of the future research. On the basis of the above analysis , 
this paper summarizes the shortcomings of different types of research front identification methods and the existing uni- 
versal problems , and looks forward to the future research priorities. 
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